从大模型到消费税:产业视角的观察和思考
1 toC 的一些思考
大模型 toC 应用的窗口没有打开,这是我离开美团前的认知和判断,不是说做不出好的 toC 应用,事实上我认为大模型对人类最有价值的方向,首推教育和科研。能够提高整个系统的科学发现速率,这是一件大事,这个世界绝大多数的实质经济增长都来自于科学和技术的进步。
教育和科研这两个场景,从使用者的角度来说,可以算作 toC 范畴(当然也可以做成 toB 产品,这并不影响我们下面的讨论)
1.1 市场体量与规模效应
从目前的发展情况看,大模型主要的作用供给侧的降本增效,不改变流量的迁移。
所以至少当前阶段思考大模型对剪映的影响应该比对抖音的影响更有意义。比如我可以做 1000 个、10000 万个虚拟 AI 小姐姐 24 小时不间断在抖音上狂轰滥炸。站在短视频消费者的角度,在合规的范围内,真人主播和 AI 主播对于用户而言区别不大,看谁不是看?AI 小姐姐再美,整体使用时长也很难有大幅提升,因为用户体验还没有做到代际差异。
更进一步,如果我们认为这一轮技术变革的主题是智能的涌现。消费娱乐对于智能的诉求好像并不是那么迫切,如果用一个表达式来说的话
消费娱乐类应用用户体验 = f(智能,移动互联网,以外其他因子)
当年移动互联网把很多线下场景搬到线上以后,体验有了明显提升,所以我们可以说“移动互联网”因子的系数比较大。目前“智能”的系数在这个函数里,好像不是很大的样子,直觉上“智能”对于效率生产力类工具的体验提升会更大。
但效率生产力类工具的问题是,它们的市场体量天花板不算特别高——市面上各种文档软件、笔记软件、时间管理软件可以给我们一定的估算参考。
这是人性的问题,明明可以选择爽,为什么要逼自己自律,我是不是有病?而且 toC 类效率生产力工具发展到最后,可能和另一个赛道——手机终端厂商做 copilot 的那批人迎头撞上,然后一起竞争。
从规模效应的角度来看待 toC 类应用,也是一个很有意思的话题。之前的老板让我看王慧文的小册子学习如何做PM,我总是对其中规模效应与马太效应的区别感到迷惑,因为规模效应和马太效应这两个现象好像是伴生的:抓住了有规模效应的要素才具有马太效应,或者马太效应的前提 是你得有规模扩展的空间。
现在我发现了一个很好的例子,就是当下大模型更多展现出的是马太效应而非规模效应。
具体来说,它对于个体赋能的上限空间是非常高的,适合“孤狼”型选手,比如说像陶哲轩这种人,大模型可以帮他寻找解题的灵感,帮他进行形式化证明,工作的效率可以相比以前大幅提高。比如一个刚实习的开发实习生,没有办法事无巨细地请教同事之前写的历史代码,同事也很难有时间和精力手把手帮实习生解决困难,现在大模型对于编程入门的体验是有大幅提升的,我们当年学编程的时候从来没搞清楚 using namespace std 内部到底是在干什么,只知道不写就会报错,如今 LLM 可以随时回答我们的各种疑问。
但是,对于一个工作中不需要太多创新和思考的文员,大模型就没有那么多的帮助。
所以至少目前而言,大模型应用的规模效应不是很明显,不是说用户越多就体验越好。但大模型对于个体之间的马太效应很明显,善用的人和不会用的人之间会有越来越大的差距。
1.2 关于政策的考量
我们首先从大模型对教育的影响说起。
我们至今的教育制度都是普鲁士教育制度的遗物,主要教授填鸭式的应试知识,工业时代人们并不需要创造新知识,只需要继承一些既有知识,就能在后半生靠这些知识来维持生计。
当下其实已经到了需要反思教育制度的时候,如果一个人学了一辈子的应试知识,还是不如大模型懂得多,那么这种教育制度其实已经没有太大意义了,我们需要更多如何创造知识、启发如何思考的教育。
我研究生导师研究的一个方向是自适应学习,在上一轮AI浪潮中,自适应学习主要通过以知识点为颗粒度的知识图谱+推荐算法,实现千人千面的“练”,但没有实现千人千面的“学”。
比如说自适应学习系统可以检测出来我没有掌握相对论这个知识点,并且可以给我推荐相关的教程和习题,但是没有办法根据我的实际情况,帮我更好地理解相对论。现在 LLM 其实可以做到在我学习相对论的过程中,存在哪些理解上的卡点,然后真正做到因材施教,这是非常有意义的。
但后来也没敢从事教育行业,主要问题还是摸不清政策的底线。2021 年 3 月 6 号两会上的讲话,我们当时看到了,也知道基础教育后面会有整顿,但仍然没有想到会有这么剧烈的整顿。
培训乱象,可以说是很难治理的顽瘴痼疾。家长们一方面都希望孩子身心健康,有个幸福的童年;另一方面唯恐孩子输在分数竞争的起跑线上。别的孩子都学那么多,咱们不学一下还行啊?于是争先恐后。这个问题还要继续解决。 —— 2021.3.6
有人说最近教培放松了,这是不是对教培政策的反省?我觉得不是,我们去看 2022 年、2023 年连续两年的经济工作会议,反思的从来不是认为教培政策错了,反思的是“宏观政策取向一致性不到位,出现了‘合成谬误’,要把非经济性政策纳入宏观政策取向一致性评估”,也就是说拆开来看,他们认为每政项策都是正确的。
那么我们做一个猜想,假如随着宏观情况的好转,合成谬误的效果不明显了,那有形的手是不是还可以继续干这个行业?而且资本已经对这个行业风声鹤唳了,想要重新大规模投入这个行业也是一个比较困难的事。
另一个赛道也是一样,我还在前司的时候,前司做了一款叫 wow 的 c.ai 类应用,如果让一个每天看新闻联播的人来做决策,这是要打问号的。无论海外 C.AI 和 Talkie 的增长、留存和使用时长数据有多么惊艳,我只会担忧一件事,那就是站在人口问题的角度,这种东西规模大了没有什么好处。明面也许上不反对,但肯定也不会支持,想要管控很简单,首先把这类应用定义成游戏,然后游戏牌照发放是归新闻出版总局的,新闻出版总局和宣传部是一套人马两个牌子,这不是可以讨价还价的地方。
我们当下处在一个从右往左转向,且不知道会持续多久的阶段,那就一定需要考虑非市场化的那个力量想要干什么、要解决什么问题。如果你要干的事和它要干的事是冲突的,那还是想开点另寻出路吧。
有时候我们会抱怨这种自上而下的干预,但并不是所有的干预都是拍脑袋的,很多时候是有现实基础的。上面这张图的转向,而不是伟大的舵手一声令下说要掉头,船就能掉头的。我们可以举一个微观视角的现象进行观察,最近有一个叫童润中的小伙子,为什么他在网上喊一声阶级斗争,能够一呼百应?
“童润中”们才是这艘巨轮转向的民意基础。
中国很大,1978 年以来获得硕士及以上学位的人不过1200万,不到总人口的1%。摆脱那虚假的优越感和偏见,1%之外的世界,才真实地反映了现实的全貌,我们需要以更广阔的视野去理解我们所处的世界与时代,那些艰难却急需回应的命题和每个人都有关系。
2 toB 领域的观察和体会
toB 领域我是一个刚入门的初学者,以下最近半年的一些观察和体会。
如果拿 toB 和 toC 进行对比的话,一个众所周知的情况是,在经历了PC互联网和移动互联网两次浪潮后,国内 toB 发展得没有 toC 好。
这个现象说明可能是一些内生性的因素在约束 toB 行业的发展,不然不可能经过二十多年的发展,而且我们的政策提产业互联网也提了好多年了,至今仍然还没有看到国内有比较综合实力比较强的、具有国际竞争力的 toB 龙头企业出现。
我们也一定是在这些约束条件下(而且大模型未必能解决这些约束条件)求解问题。
2.1 产业结构视角
第三产业,特别是其中的金融和科技行业,由于利润率较高、业务线上化程度高,所以相比一、二产业对于信息软件服务的需求更强。相比发达国家而言,我们第三产业占比还较小,2023年,我国服务业(第三产业)增加值占GDP的54.6%。而早在20世纪40年代,美国第三产业在GDP中占比就已接近60%,目前第三产业占美国GDP的81.6%。
第三产业占比小只是结果,而不是原因,我们不能乐观地说因为现在占比小,所以企业软件服务行业的市场规模天花板还有较大增长空间。
从企业规模角度看,我们的企业分布情况是:头部企业数量比较少但是市占率挺高,尾部的企业数量很多但是规模很小,中间的腰部企业不多。
一般而言,小微企业的 IT 投入较少,可能数字化改造都没做完,生命周期也较短,续费的持续性也较低。
头部企业的问题是议价能力比较强,总会提很多定制化需求,定制化需求是一片“无底洞”,国内又是一个供给过剩的内卷状态,导致头部企业总能找到愿意低价承接定制项目的乙方。如此一来,单纯依赖头部商家的软件公司很难实现盈利,甚至是华美的袍下都是虱子——看似营收不错但是财务状况很差。如果中国腰部企业比例能多一些,toB软件市场拓展和产品标准化会更顺畅些。
2.2 经济体制视角
事实上我们上面讨论的头部企业很大一部分比例是国企。国企,特别近些年小院高墙、脱钩断链的背景下,一个趋势就是愈发强调自主可控,倾向私有化部署,数据不出门、不落地,倾向于自主研发或者项目定制开发。很多国企可能有相当大规模的 IT 团队,比如工商银行 IT 部门员工有数万人,比服务他们的乙方企业规模大了去了。
在这样的环境下,企业软件服务的非标准化和外包化情况很明显,乙方卖的不是产品,而是人天劳动,这和旧社会佃户向地主出卖劳动力没什么区别,制约了软件服务的规模效应。
只是卖劳动力也就算了,关键还不是市场化地卖劳动力,也就是说不是你的产品优秀、企业优秀,就能在竞争中获得优势,市场中仍然留存着大量低质量的企业没有出清,有大量的关键节点(人)阻碍市场的整合。比如前不久某地方银行 4.27 亿元买的易鲸捷国产数据库是个什么玩意儿?这个行业里只有易鲸捷一个坏人?
我们笑话前不久韩国曝出来某组织花了430亿韩元从我国民用公司采购100架无人机,有没有可能只是五十步笑百步,这种极度非市场化的领域,没事的时候一片太平,有事就是大案要案。
所以从整体上看,目前 toB 服务企业在产业链上的话语权不够大,现金流相比 toC 类企业也更脆弱。
2.3 行业属性视角
ToB 行业不容易建立同理心,在 toC 领域如果你有比较强的同理心,那么你可能比较容易挖掘用户的需求,因为同理心是在尝试用自己的感受去理解他人,比方说一个来自东北的产品经理思考一个海南消费者买菜的需求,虽然可能有一定阻碍,但也不排除能做得很好。
但 ToB 的难度会大很多,企业的差异大于个体的差异,企业的共性小于个体的共性。toB 场景满足的是行业场景的需求,提升的是企业效率,如果你都不了解这个行业、不了解这个企业的工作流程,不掌握行业数据,那何谈需求的发现和解决?
特别是探索 LLM 这么一个新事物,既不懂这个市场,又想着用新技术在这个市场去落地,那确实是一个很难的事情。toB 只能一个行业一个行业做,不可能 toC 那样烧钱抢用户然后 winner take all,互联网巨头们宁愿搞社区团购也不搞这玩意儿,说明这不是一个非常性感的事。
2.4 生产与消费视角
我们是一个重生产轻消费的国家,这有很多个解释,比如说数千年农耕文化所塑造的备灾备荒的文化属性,比如说建国后全民省吃俭用赚外汇,比如说我们的税收制度是以增值税为主的鼓励生产的制度。
无论如何,鼓励生产的一个后果是,整体产能易于过剩,企业利润空间被压缩,削弱了企业的消费能力,从而对企业服务市场形成了进一步的负面影响。
如果我们认为 toB 软件服务的收入大多来自帮助客户“降本增效”后的分成,目前大模型在企业场景落地更多地还是在“降本”,但是在一个产能过剩、需求不足的环境中,还能降多少本?不好说。
我们还是需要思考更多解决需求问题的“增效”,消费税改革是一个改善需求不足的政策,但政策的落地见效可能需要相当漫长的时间,远水不解近渴,更多还是要向内求。
3 结语
有人曾经回忆 2019 年时候中石油组织的一场行业论坛上,CV四小龙之一的某公司做报告,PPT的前几页全部用来介绍创始团队的背景,诸如名校学历、国际大赛获奖经历、平台如何先进、算法如何精妙、技术指标如何卓越,各种“率”密密麻麻。等到实际内容开始时,已经过去了十几分钟,而整个报告不过也就20分钟,这种风格在中石油的论坛上显得格外“与众不同”。
5 年后虽然换了一拨人,但好像风格也差不多,诸如某某名校背景,抑或是 XX 大厂离职创业,然后 MMLU、superGLUE 等各类榜单上取得了非常优异的成绩,媲美 GPT4-o……
这里没有嘲讽的意思,事实上所有探索大模型应用的从业者都是向无人区深航的勇者,无人区里没有前方,没有后方,没有安慰,没有寄托,甚至没有理想,没有希望,那是逆境中的逆境。但这并不妨碍芦苇们思考,发明 GPT5 又不是发明外星人,方向永远是更便宜、更智能, 这是量变而不是质变,无论 GPT5 出没出来,我们都可以去思考未来会是什么样。
每一天都是崭新的篇章,
都是纪念日,
而疼痛如此遥远。
暴风雨中的海燕,
在永恒的战利品中,
你只拥有黄昏的星。
是,不改颜色的孤星。
—— 君特·艾希 & GPT-4o